یادگیری ماشین آنلاین چیست و چرا نقش مهمی در دنیای هوش مصنوعی دارد؟
۱۴۰۱/۰۳/۱۳ تاریخ انتشار

 زمانی‌که داده‌های جدیدی دریافت می‌کنیم چه اتفاقی می‌افتد؟ اگر تنها یکبار اقدام به آموزش مدلی کنیم و فرآیند آموزش آن‌را به‌روزرسانی نکنیم شانس دریافت بینش‌های دقیق‌تر و به‌روزتر را از دست می‌دهیم. رویکرد فوق به ویژه در محیط‌هایی که الگوی رفتار پویایی دارند مهم است. خرید‌های آنلاین یکی از این موارد است. برای واکنش به داده‌های جدید و ساخت الگوریتم‌های هوشمند که با گذشت زمان مباحث مختلف را یاد بگیرند، مهندسان یادگیری ماشین به یکی از دو روش زیر کار می‌کنند. در روش اول به شکل دستی روی جمع‌آوری داده‌های جدیدتر آموزشی متمرکز می‌شوند و پس از اطمینان از درست بودن آن‌ها، داده‌ها را در اختیار مدل قرار می‌دهند. در روش دوم، برنامه‌ریزی می‌کنند تا داده‌های جدید یک بار در هفته به‌روزرسانی شوند و به‌طور خودکار به مدل تزریق شوند. در 99 درصد موارد، زمانی که شرکتی ادعا می‌کند هوش مصنوعی که طراحی کرده فراتر از تصور است در حقیقت به این نکته اشاره دارد که رویکرد به‌روزرسانی دو هفته یکبار در ارتباط با تزریق داده‌های جدید و آموزش مدل را به کار می‌گیرد. به بیان ساده‌تر، شرکت مذکور از رویکرد آموزش آنلاین استفاده کند. در بیشتر منابع زمانی که صحبت از هوش مصنوعی به میان می‌آید از یادگیری ماشین که به لحاظ فنی به معنای آموزش مدل یا شبکه عصبی است که برای انجام پیش‌بینی‌های خاص آموزش دیده به عنوان مترادف هوش مصنوعی استفاده می‌شود. در روش سنتی یک مدل بر مبنای مجموعه داده‌ها و نمونه‌های در دسترس آموزش داده می‌شود و زمانی که فرآیند آموزش به پایان رسید این امکان فراهم می‌شود که برای پیش‌بینی، شناسایی و کاربردهای مختلف از مدل استفاده کرد. به‌طور معمول، به این روش آموزش یادگیری آفلاین یا یادگیری دسته‌ای می‌گویند که روشی سنتی است که برای آموزش شبکه عصبی و مدل‌های یادگیری ماشین از آن استفاده می‌شود. در روش فوق تنها بر مبنای داده‌هایی که در دسترس قرار دارد آموزش انجام می‌شود و مدل تنها قادر به پیش‌بینی نوع مشابهی از داده‌ها است. یادگیری آفلاین به دلیل کم هزینه‌ بودن به شکل گسترده‌ای در صنایع استفاده می‌شود. 

یادگیری ماشین آفلاین به شیوه سنتی

یادگیری ماشین نقش مهمی در تجزیه و تحلیل داده‌های مدرن و برنامه‌های هوش مصنوعی دارد. الگوهای یادگیری ماشین اغلب در یک الگوی یادگیری گروهی کار می‌کنند که در آن یک مدل توسط برخی از الگوریتم‌های یادگیری روی کل داده‌ها یک بار آموزش داده می‌شود و در ادامه مدل آموزش داده شده روی داده‌های جدید ارزیابی می‌شود. امروزه با افزایش حجم داده‌ها، کاربرد یادگیری ماشین به دلیل محدودیت در حافظه پردازشی محدودتر شده، به ویژه هنگامی که داده‌ها به شکل آنلاین رشد و توسعه می‌یابند. روند کند یادگیری به ویژه در ارتباط با یادگیری ماشین گسترش‌پذیر برای داده‌های حجیم و یادگیری برای داده‌های لحظه‌ای در هوش مصنوعی به یکی از چالش‌های بزرگ دنیای هوش مصنوعی تبدیل شد. 

موارد یاد شده به یک نکته مهم اشاره دارند، اگر فرآیند آموزش را هفتگی یا حتا روزانه کنید، بازهم عقب هستید. مدل شما هرگز به‌طور کامل با وقایع جاری به‌روز نمی‌شود، زیرا آموزش مبتنی بر داده‌های قدیمی بوده است. در حالت ایده‌آل، آن‌چه شما می‌خواهید مدلی است که بتواند از نمونه‌های جدید نزدیک به زمان واقعی یاد بگیرد و علاوه بر این نه تنها در زمان واقعی پیش‌بینی کند، بلکه در زمان واقعی نیز یاد بگیرید. به‌طور سنتی یادگیری ماشین به شکل آفلاین انجام می‌شود و به همین دلیل یادگیری آفلاین (Offline Learning) نامیده می‌شود، به این معنی که ما گروهی از داده‌ها داریم که قرار است پالایش شوند، بهینه‌سازی شوند و به عنوان ورودی در اختیار الگوریتم قرار بگیرند. با این حال‌، اگر داده‌های جریانی (streaming data) دارید و در نظر دارید از این داده‌ها استفاده کنید باید به سراغ آموزش آنلاین بروید. رویکرد آنلاین مزیت بزرگی نسبت به نمونه سنتی دارد، زیرا اجازه می‌دهد با دریافت نوع جدیدی از داده‌ها، تخمین‌های ارائه شده توسط مدل را به‌روز کنیم و کیفیت خروجی را بهبود بخشیم، به جای آن‌که صبر کنیم تا فرآیند آموزش به پایان برسد و بعد به ارزیابی خروجی‌ها بپردازیم. 

یادگیری ماشین آنلاین چیست؟

یادگیری ماشین برخط (Online Machine Learning) در زیرمجموعه مباحث یادگیری ماشین طبقه‌بندی می‌شود. همان‌گونه که اشاره شد، بیشتر برنامه‌های مبتنی بر یادگیری ماشین، داده‌های از قبل جمع‌آوری شده را به عنوان ورودی (مانند محتویات جداول پایگاه داده) از یک فایل که قالب‌بندی خاص خود را دارد دریافت می‌کنند و به‌طور پیوسته روی این مجموعه داده‌ها پردازش‌هایی انجام می‌دهند، اما در یادگیری ماشین آنلاین نحوه دریافت داده‌های ورودی متفاوت است. در یادگیری ماشین آفلاین، داده‌های ورودی باید ثابت و مشخص باشند تا امکان آموزش مدل بر مبنای آن مجموعه داده‌ها فراهم شود. مزیت روش فوق این است که امکان به‌کارگیری آن در بیشتر صنایع فراهم است، زیرا داده‌ها حالت ایستا دارند و قرار نیست پس از پالایش داده‌ها تغییر کلی روی آن‌ها اعمال شود. نقطه ضعف روش فوق این است که قابلیت آموزش مدل در لحظه وجود ندارد و باید مدت زمانی سپری شود تا داده‌ها به‌طور کامل جمع شوند و در ادامه مدل آموزش ببینید که در برخی کاربردها این روش مقرون به صرفه نیست. برای حل این مشکل الگوی یادگیری ماشین آنلاین ارائه شد که توانایی آموزش لحظه‌ای مدل در ارتباط با داده‌های لحظه‌ای را دارد. یادگیری ماشین آنلاین می‌تواند نقاط ضعف الگوهای رایج یادگیری ماشین را برطرف کند که در آن پارامترهای یادگیری مدل می‌توانند به‌طور موثر توسط یک یادگیرنده آنلاین هنگامی که داده‌های آموزشی جدید وارد می‌شوند، به‌روزرسانی شود. علاوه بر این، الگوریتم‌های یادگیری ماشین آنلاین به دلیل فهم آسان به راحتی قابل پیاده‌سازی هستند. یادگیری ماشین آنلاین در حوزه‌های مختلف نظیر داده‌کاوی، آمار، بهینه‌سازی، ریاضی کاربردی، هوش مصنوعی و علوم داده استفاده می‌شود.

الگوی یادگیری آنلاین چه مزایایی دارد؟

الگوی یادگیری آنلاین به دو دلیل مهم مورد توجه کارشناسان قرار دارد. اول آن‌که با الگوی آموزشی مذکور می‌توان داده‌هایی با حجم زیاد را در زمان آموزش به کار گرفت، به‌طور مثال داده‌هایی که به دلیل حجم بالا امکان ذخیره‌سازی آن‌ها در حافظه اصلی فراهم نیست. دوم آن‌که مدل همسو با تغییراتی می‌شود که ممکن است در ماهیت داده‌ها به وجود بیاید، زیرا آموزش ماهیت پویا دارد. الگوریتم‌های یادگیری ماشین از مدل‌های آماری برای طبقه‌بندی داده‌ها استفاده می‌کنند. در صورت شناسایی هرزنامه، یک مدل یادگیری ماشین باید تشخیص دهد که آیا ترتیب کلمات موجود در ایمیل با کلمات موجود در نمونه ایمیل‌های هرزنامه شباهت دارد یا هیچ‌گونه ارتباطی در میان نیست. امروزه الگوریتم‌های مختلف یادگیری ماشین آنلاین می‌توانند هرزنامه‌نامه‌ها را تشخیص دهند، هرچند الگوریتم‌هایی نظیر الگوریتم بیز ساده یکی از قدرتمندترین گزینه‌ها در این زمینه است. همان‌گونه که از نام این الگوریتم مشخص است، بیز ساده مبتنی بر قضیه بیز (Bayes’ theorem) است که احتمال وقوع یک رویداد را بر اساس دانش قبلی توصیف می‌کند. با این‌حال، محتوای هرزنامه‌ها تغییر می‌کند و افرادی که هرزنامه‌ را ارسال می‌کنند نوع فعالیت‌های خود را متناسب با پیشرفت‌های مستمر الگوریتم‌های گوگل تغییر می‌دهند. بنابراین الگوریتم‌های تشخیص ایمیل از هرزنامه‌ها در گوگل باید بر مبنای رویکرد یادگیری آنلاین کار کنند تا بتواند ایمیل‌هایی که در گذر زمان تغییر کرده‌اند و هرزنامه هستند را شناسایی کند. در واقع یادگیری الگوریتم با تغییر محتوا و شکل هرزنامه، بروز می‌شود.

یادگیری ماشین آفلاین و آنلاین چه تفاوت‌هایی دارند؟ 

مبحث یادگیری را می‌توان از زوایای مختلف بررسی کرد که تفاوت میان یادگیری دسته‌ای (Batch Learning) و یادگیری آنلاین (Online Learning) یکی از آن‌ها است. آگاهی در مورد این تفاوت‌ها از آن جهت مهم است که روند حل مسائل موجود در حوزه‌های مختلف را ساده می‌کند. تفاوت این دو معماری را می‌توان با یک مثال ساده شرح داد. فرض کنید دانشجویی قصد یادگیری معادلات و دیفرانسیل دارد. در حالت اول (سنتی)، این دانش‌آموز می‌تواند مجموعه کتب دیفرانسیل و آمار را تهیه کند و چند مرتبه آن‌ها را مطالعه کند تا یاد بگیرد. بعد از این‌که نکات مدنظر خود را دریافت کرد، دیگر مطلب جدیدی یاد نگیرد و از این به بعد فقط از دانسته‌های خود برای حل مسائل استفاده کند. این نوعی یادگیری، یادگیری آفلاین نام دارد، در حالت دوم که یادگیری آنلاین است دانش‌جو کتاب‌های مربوطه را مطالعه کند، نکاتی از آن‌ها یاد می‌گیرد و در زمان استفاده از دانسته‌های خود برای حل مسائل، هرگاه کتاب جدیدی در حوزه معادلات پیدا کرد، آن‌را تهیه می‌کند و با خواندن آن، آموخته‌های خود را به‌روز می‌کند و نکات جدیدی یاد می‌گیرد. داده‌هایی که در یک فرآیند داده‌کاوی، طبقه‌بندی و خوشه‌بندی می‌شوند در گروه داده‌های دسته‌ای قرار می‌گیرند به این معنا که در زمان یادگیری تمامی داده‌ها در اختیار الگوریتم قرار دارند و الگوریتم به نوعی قادر است بر مبنای داده‌های دریافتی عملیات یادگیری را انجام دهد. با این‌حال نوع دیگری از یادگیری نیز وجود دارد. برخی اوقات داده‌ها به صورت جریان ‌داده دریافت می‌شوند یا لازم است یادگیری به شکل منظم انجام شود. همان‌گونه که اشاره کردیم یادگیری آفلاین مشابه این حالت است که شما کتابی دارید و باید این کتاب را مطالعه کنید. تمام منبع شما همین کتاب است و در واقع تمامی داده‌ها را دارید، اما فرض کنید در مسیر تجاری قرار دارید و روزانه با اطلاعات جدیدی که به شما داده می‌شود باید نکات جدیدی از آن‌ها یاد بگیرید و آموخته‌های خود را به‌روز کنید. این حالت مصداق بارز یادگیری آنلاین (Online Learning) است، یعنی هنگامی که تمامی داده‌ها در زمان حال در دسترس نیستند. در یادگیری آنلاین مدلی ساخته می‌شود و با رسیدن داده‌های جدیدتر، مدل به‌روزرسانی می‌شود.

انواع مختلف مدل‌های یادگیری آنلاین

به لحاظ تئوری، روش‌های یادگیری مبتنی بر سه رویکردی اصلی نظریه یادگیری، نظریه بصری و نظریه بازی هستند. از دیدگاه الگوریتم‌های خاص، می‌توانیم تکنیک‌های یادگیری آنلاین موجود در دسته‌های مختلف را با توجه به اصول یادگیری خاص گروه‌بندی کنیم. به‌طور خاص، با توجه به نوع اطلاعات بازخورد و انواع نظارت در وظایف یادگیری، تکنیک‌های یادگیری آنلاین را می‌توان به سه گروه زیر تقسیم کرد. گروه اول مبتنی بر رویکرد یادگیری با ناظر آنلاین هستند. در رویکرد فوق اطلاعات کامل در ارتباط با بازخوردها در پایان هر دوره آموزش آنلاین به مدل ارائه می‌شود. این الگو را می‌توان به دو گروه نظارت بر یادگیری که مبنای زیربنایی یادگیری را شکل می‌دهند و یادگیری آنلاین کاربردی که عمدتا مبتنی بر یادگیری با ناظر آنلاین هستند طبقه‌بندی کرد. در این حالت این امکان وجود ندارد که از رویکردهای زیربنایی به شکل مستقیم استفاده کرد و بر همین اساس الگوریتم‌ها مطابق با شرایط یادگیری آنلاین طراحی شده و استفاده می‌شوند. گروه دوم یادگیری آنلاین با بازخورد محدود است. در رویکرد فوق یک مدل آنلاین، اطلاعات بازخورد جزیی از محیط را در فرآیند یادگیری آنلاین دریافت می‌کند. مدل یادگیرنده یک پیش‌بینی از برچسب کلاس برای یک نمونه ورودی دریافت می‌کند و بازخورد جزیی را نشان می‌دهد که آیا پیش‌بینی درست است یا خیر. سومین گروه یادگیری بدون ناظر آنلاین است. در روش فوق مدل آنلاین تنها دنباله‌ای از نمونه داده‌ها را بدون هیچ‌گونه بازخورد اضافی در طول دوره یادگیری آنلاین دریافت می‌کند. این امکان فراهم است تا مدل بدون ناظر را به گونه‌ای توسعه داد که در ارتباط با جریان‌های داده‌ای از آن استفاده کرد. 

یادگیری ماشین آنلاین چه کاربردهایی دارد؟ 

همانند روش‌های یادگیری ماشین، تکنیک‌های یادگیری آنلاین می‌توانند برای حل وظایف مختلف در طیف گسترده‌ای از دامنه‌های کاربردی در دنیای واقعی استفاده شود. این امکان فراهم است تا الگوریتم‌های یادگیری آنلاین را برای وظایف یادگیری تحت نظارت توسعه داد. یکی از رایج ترین وظایف، طبقه‌بندی است که هدف آن پیش‌بینی گروهی برای یک نمونه داده جدید است که بر اساس مشاهدات نمونه‌های آموزش داده شده‌ که برچسب‌های دسته‌بندی شده می‌گیرند، انجام می‌شود. به‌طور مثال، یک کار متداول مطالعه شده در یادگیری آنلاین، طبقه‌بندی دوتایی آنلاین است مثل فیلتر کردن ایمیل‌های هرزنامه که تنها شامل دو گروه از داده‌ها هستند، گروه اول ایمیل‌های هرزنامه و گروه دوم ایمیل‌هایی که هرزنامه نیستند. علاوه بر وظایف طبقه‌بندی، یکی دیگر از کارهای یادگیری تحت نظارت معمول، تحلیل رگرسیون خطی است که به فرآیند یادگیری برای تخمین روابط میان متغیرها اشاره دارد. از تکنیک‌های یادگیری آنلاین برای انجام وظایف تحلیل رگرسیون، مانند تحلیل سری زمانی در بازارهای مالی که نمونه‌های داده به‌طور طبیعی به صورت پیوسته وارد می‌شوند، استفاده می‌شود. علاوه براین، الگوریتم‌های یادگیری آنلاین می‌توانند برای کارهای یادگیری بدون نظارت استفاده شوند. در فرآیند دسته‌بندی اشیاء هدف این است که اشیایی که شباهت بیشتری به یکدیگر دارند در خوشه‌های مخصوص به خود طبقه‌بندی شوند. در خوشه‌بندی آنلاین هدف تجزیه و تحلیل خوشه‌ای افزایشی در یک توالی داده ورودی است. از دیگر کاربردهای یادگیری آنلاین می‌توان به پیاده‌سازی سیستم‌های توصیه‌گر، رتبه‌بندی یا یادگیری تقویتی اشاره کرد. تکنیک‌های یادگیری آنلاین اغلب در دو سناریوی اصلی استفاده می‌شوند. اولین مورد بهبود بهره‌ورى و دومین مورد گسترش‌پذیرى در روش‌هاى یادگیرى ماشین دسته‌اى است که در آن مجموعه کامل داده‌هاى آموزشى باید قبل از آموزش در دسترس قرار گیرند.

به این مطلب چند ستاره می‌دهید؟(امتیاز: 4.5 - رای: 1)

ثبت نظر تعداد نظرات: 0 تعداد نظرات: 0
usersvg